#AI 視訊 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#AI 視訊

“訂單飆升500%”！又一爆款，全球“刷屏”

近兩年，海外短劇市場迎來爆發式增長，尤其是在當前中國短劇市場競爭激烈程度持續升級的背景下，出海似乎是短劇製作企業更優的選擇。而今年，AI讓短劇出海迎來了新的機遇。有企業表示，今年以來，他們來自海外平台的AI短劇訂單明顯增加。已經發出去的片子增長5倍左右，預估今年全年出海AI短劇同比增長在50倍左右。 AI短劇成新風口佔微短劇產量超九成 2026年，AI短劇成為行業新風口。據中國網路視聽協會資料，今年一季度，全行業上線微短劇約12.8萬部，其中AI微短劇就達到約12.2萬部，佔比超過95%。為什麼微短劇行業的供給結構發生如此深刻的轉變？在上海一個寫字樓裡，一家AI短劇工作室的製片人朱爽，正在和合作夥伴溝通進行中的項目。去年8月，她放棄了真人實拍短劇業務，開始開拓AI短劇新類股。

淘寶京東們，快被AI逼瘋了

過去我們在電商平台上，最怕遇到的事情是“圖物不符”。生怕一些沒良心的商家在產品詳情圖上給咱們挖坑。而如今劇情迎來了反轉。可能大家在一些視訊平台上也有刷到：部分使用者利用手中的AI工具把完好的商品“P”成一張破損、帶污漬的殘次品照片，然後再拿著它去找平台申請“僅退款”，從而錢貨雙收。（圖片來源：小紅書截圖）平台在面對這些畫質清晰、光影自然真實的照片時，會優先將貨款退還給買家，甚至還可能反手給賣家扣點信譽分。電商本質上就是一門“看圖說話”的生意。當 AI 能夠毫無門檻地“無中生有”捏造虛假證據時，維繫電商運轉十幾年的底層信任就徹底崩塌了。

AI Coding之後，視訊模型正在跑通商業閉環

過去一年，AI行業最成功的賽道，非AI Coding莫屬。從Cursor、GitHub Copilot，到Claude Code這類程式碼Agent，它們的價值非常直接：使用者每天都要寫程式碼，企業每天都要交付項目；只要AI能少寫幾行重複程式碼、少踩幾個bug、少花幾小時偵錯，價值就能被很快算出來。但現在，另一個曾經被認為太燒錢、太炫技、太難賺錢的領域，也開始出現相同訊號。很可能是第二個有望跑通商業閉環的賽道。它就是AI視訊模型。

剛剛！快手計畫分拆“可靈AI”，估值超1300億、明年IPO上市

這次，中國國內將會出現一家千億級多模態AI公司。 5月11日消息，據報導，快手科技計畫在將其旗下可靈（Kling）AI視訊業務分拆，並計畫明年實現IPO上市。報導稱，快手已與潛在投資者就可靈Pre-IPO融資進行洽談，該輪融資對可靈的估值將達到200億美元（約合人民幣1300億元）。分拆原因，一方面與資本市場有關，另一方面，快手希望可靈與字節、阿里巴巴等公司的產品展開更多的競爭。

字節家的搖錢樹，阿里騰訊都想搶

科技大廠既眼紅AI視訊的好生意，沉重的算力消耗也讓人望而卻步。AI短劇帶來的極致成本優勢與工業化生產效率，引爆了資本熱情，也讓AI視訊賽道格局重構。4月初，一匹黑馬殺出：視訊生成模型HappyHorse-1.0在第三方測評平台Artificial Analysis登頂，文生視訊Elo得分1333、圖生視訊Elo得分1392，雙雙超越字節跳動Seedance 2.0與快手可靈，成為不容忽視的新變數。4月10日中午，阿里下場“認領”HappyHorse為“ATH事業群”旗下的AI創新事業部自研，API將在4月30日開放。此前，阿里並非視訊生成的核心玩家。但3月16日，阿里新成立以Token 為核心的“ATH事業群”後，提升多模態能力變成了拉高Token效率的抓手——而HappyHorse可視為這場戰略大轉向的重磅成果之一。不只阿里，科技巨頭正在視訊生成賽道集體壓境。憑藉Seedance系列的生成質量與成熟商業化，字節跳動已構築起顯著壁壘。據瞭解，火山引擎面向企業開放的Seedance API介面，有些機構得到的最低年消費門檻高達1000萬元。以高門檻開放API的底氣，來自市場的極度供不應求。《中國企業家》獲悉，在火山引擎近期的招商會上，許多城市與火山引擎和視訊生成業務洽談合作，有城市為此投入了數千萬、上億元資金，將算力支援作為招商引資的重要配套。另一巨頭騰訊也已下場。知情人士向《中國企業家》透露，騰訊挖走了Seedance開發團隊中的數名核心成員，計畫在5月推出混元視訊大模型新版本，與Seedance正面對壘。“5月的視訊模型賽道，將會格外熱鬧。”01 阿里認真了HappyHorse亮相之前，阿里雖有通義萬相視訊模型，但表現始終不溫不火。作為大模型生態的附屬功能，萬相此前在清晰度、運動連貫性、長視訊穩定性等核心指標上，與Seedance、快手可靈等有明顯差距，也未打通專屬商業化場景。這一次，阿里好像認真了。HappyHorse採用150億參數，將文字、視訊、音訊三種模態Token置於同一序列聯合建模，從底層解決了音畫不同步、語氣與表情不匹配等問題。“它的物理模擬更貼近真實環境。”一位測評人士告訴《中國企業家》。另外，HappyHorse原生支援七國語言唇形同步，詞錯誤率顯著降低。同時，它在成本與速度上表現優異：單張H100生成5秒1080p視訊約38秒，DMD-2蒸餾技術將去噪步驟壓縮到了8步。但HappyHorse的短板同樣突出。測評人士表示，在完成複雜動作與多人互動時，HappyHorse易出現肢體錯亂、軌跡不穩。相比於Seedance，HappyHorse更擅長鏡頭呈現，不擅長動作敘事。在應用方面，HappyHorse的API尚未開放，在內測中，其支援的時長僅為5~10秒，場景上限較低，更適合做短影片、廣告、AI漫劇素材，還難以支撐劇情長片。其本地部署也有門檻，需配備H100或A100顯示卡，消費級顯示卡無法運行。阿里突然在視訊模型戰場投入火力，意欲何為？相關人士表示，HappyHorse誕生於淘天未來生活實驗室，或許意味著阿里希望其能與電商場景碰撞融合。阿里擁有完整的商品、商家、交易與廣告生態，但商品視訊一直是中小商家的痛點：場景搭建、拍攝剪輯成本高，白底圖難以展現賣點。而AI視訊可批次生成多版本、多場景、多語言內容，大幅降低了創作門檻。更關鍵的是，阿里的商品詳情、使用者評價、搜尋行為、轉化資料、直播表現等全鏈路資訊，也可反向訓練電商專屬視訊能力，讓HappyHorse成長為懂電商、能帶貨的內容生產引擎。但這條商業閉環要跑通，除了技術攻堅，還必須先解決阿里的算力問題。接近阿里的人士向《中國企業家》透露，目前阿里內部GPU分配非常緊張。“此前，像月之暗面作為阿里雲大客戶，雖然與Qwen存在競爭，還是能獲得比較充足的算力。現在阿里要支援基模研發、電商、雲服務多條戰線，未來要重新考慮GPU的投入產出比了。”而視訊生成是算力消耗大戶，如果HappyHorse逐步開放推廣，算力需求更將指數級增長。這匹黑馬能跑多快、多遠，很大程度上取決於阿里能否破解算力這一核心瓶頸。02 Seedance的好生意被盯上了儘管挑戰重重，各大廠商仍爭相湧入AI視訊賽道，只因這是一門想像空間極強的生意。目前，紅果短劇等平台收一部劇的最高價格約2000元/分鐘，一部常規短劇的時長約120分鐘，價格約24萬元。而市場上AI短劇的外包製作報價已經低至400元一分鐘，甚至有團隊用自動化工具實現了一天800~1000分鐘的漫劇內容產出。巨大的成本優勢和生產效率，讓AI短劇成為資本追逐的熱點。有AI視訊製作公司負責人告訴《中國企業家》，短短半個月，就有好幾家資本來談收購、併購，目前給他們的估值已超5億元，但他們和合夥人都覺得，這個出價還不夠“美麗”。更有地方政府直接找上門來，希望直接獨家買斷公司的AI漫劇自動化生成工具。Agent技術的進展，也正讓一人公司（OPC）大量湧現。幾個擅長高效使用AI工具的員工，便能頂得上過去一個甚至幾個團隊的工作量。各地政府敏銳地捕捉到了這一趨勢，紛紛對AI視訊、AIGC、AI短劇推出算力補貼、內容獎勵、園區集聚等扶植政策，吸引OPC進入。2月27日，武漢東湖高新區發佈“微短劇八條”，對重大產業項目最高支援5000萬元，爆款短劇單部獎勵50萬元。3月10日，上海市徐匯區發佈《“AI+微短劇”產業扶持意見》，對頭部企業最高給予1000萬元發展支援，同時發放最高100萬元算力券、100萬元語料券，並為OPC減免工位費用。3月13日，深圳市施行新版微短劇扶持政策：AIGC微短劇單項目最高資助200萬元。需求的旺盛和政策扶植，讓字節成為最早嘗到甜頭的公司。據《中國企業家》瞭解，雖然火山引擎向大型影視公司、內容製作公司、特定機構等開放的Seedance API介面“白名單”，有些機構被要求“最低消費”1000萬元/年，客戶仍趨之若鶩。接近火山引擎的人士告訴《中國企業家》，地方政府已將算力扶持作為招商引資的重要配套。一些AI短劇公司以“拼盤”接入API，不少算力費用由政府出面解決，以吸引相關公司落地。“有些城市採購了火山3000萬、7000萬，甚至過億的費用，用於內容扶植。當然其產出的內容也將對本地稅收和GDP產生極大拉動，這個帳很好算的。”清晰可見的變現路徑，疊加千億級的市場增量，點燃了巨頭間的競爭熱情。阿里、騰訊紛紛加碼AI視訊賽道，試圖從字節手中分走一杯羹。接近騰訊的相關人士向《中國企業家》透露，混元視訊模型其實早就有了，“只是效果很差”。近期，騰訊痛下決心，“開出高薪，差不多把Seedance開發組整個挖走了”。新款模型大約5月上線，有望和Seedance掰掰手腕，在短時間內實現技術突破。依託騰訊生態，混元新視訊模型還有望深度融入到視訊號的內容生產、分發、商業化全鏈路，放大騰訊的內容生產力與商業變現空間。03 視訊模型的高風險抉擇雖然所有人都看到了AI視訊在短劇、電商、廣告等領域打開的兆級商業潛力，但這條賽道的燒錢速度，也遠超想像。投入矛盾與定價分化，以及擺在巨頭面前的規模化盈利困境，正在考驗著各家的平衡智慧。雖然火山引擎的收入不菲，但其算力成本負擔依然沉重，收入中的絕大部分，都要用來採購GPU和支付電力成本。4月，火山引擎總裁譚待告訴《中國企業家》：“我們去年已經修改了商業計畫，把目標提升了不少。但目前我們還沒有做3年的盈利規劃，暫時沒有這方面的具體安排。”OpenAI關停Sora，更給狂熱的市場潑下一盆冷水。視訊生成的算力消耗，是大模型的上百倍甚至上千倍，即便全球最具財力的科技公司，也難以承受這種無底洞式投入。OpenAI雖宣稱，關停Sora是為了將資源轉向企業智能體、編碼工具與具身智能等方向，但業內普遍認為，成本與付費嚴重倒掛才是核心原因：Sora單條1080p的視訊生成成本約0.5~1美元，而使用者平均付費意願不足0.1美元，根本無法支撐持續營運。更深層的挑戰，還來自於科技大廠技術路線的高風險抉擇。業內人士向《中國企業家》指出：多模態任務過度消耗算力，在Token用量已經暴漲的情況下，廠商有再多算力依舊不夠燒，要把算力留給誰，就成了關鍵問題。由於忌憚視訊的無底洞式算力投入，Google始終不敢大規模開放API，也未推出獨立的視訊生成C端應用。“去年Google的多模態路線備受推崇，但今年便在Agent浪潮下被Anthropic趕超，現在只能說勉強留在牌桌上。大模型的核心技術路線，往往需要提前一兩年佈局，效果卻要滯後顯現。有時候真的像玄學。”行業成本與收入失衡，近期利益和遠期發展，迫使所有玩家重新審視視訊模型的商業模式與定價邏輯，這也直接催生了行業內的定價策略分化。摩根大通曾判斷：頭部領先模型可以維持溢價，追趕者則不得不通過降價搶佔市場份額。Sora停服後，字節率先選擇漲價。4月8日，即夢宣佈：基礎、標準、高級會員的月度積分分別從1080、4000、15000下調至725、2210、6160，積分縮水近六成，相當於變相漲價。相比之下，Google和快手則選擇用降價換市場：Google在3月底放出的Veo 3.1 Lite版本，將720p視訊生成價格壓至0.05美元/秒。可靈緊隨其後，推出會員限時8折優惠，部分圖片生成功能甚至完全免費。定價的兩極分化，本質上是競爭烈度的直接體現。長期來看，平台、API、廣告、電商都只是外層變數，決定勝負的關鍵因素仍然是：強化模型本身的同時，誰能在效果和成本之間找到最佳平衡點，誰能結合自身生態，找到不可替代的落地場景。 (中國企業家雜誌)

新華社18秒視訊，讓美國前高官“焦慮”了

美國國土安全部前代理部長查德·沃爾夫近日在福克斯新聞網發表一篇文章，寫了很長。而這篇長文針對的，竟是一部僅有18秒的AI視訊。這個視訊在一個月前，即3月9日，由新華社在海外社交媒體發佈，被中國駐美大使館等廣泛轉發。視訊題目是《Shield of Americas, or shackles of Americas(“美洲之盾”還是“美洲之籠”)？》，揭示美國發起的“美洲之盾”峰會及倡議，損害拉美國家獨立自主，破壞地區和平穩定。沃爾夫的文章囉囉嗦嗦講了很多，其實就是以下幾點：第一，美國應該警惕中國用AI工具瓦解美國的影響力；第二，中國深化和拉美務實合作，在美國“後院”形成戰略支點，對美國國家安全構成重大威脅；第三，為維護自身地位，美國應普及美式AI工具，加強對華科技交流審查，以遏制中國影響力。一個小影片，竟讓他嚴重焦慮，確實是小題大作了。再看事實。事實是，美國企圖借所謂“美洲之盾”，組建美國主導的地區安全合作機制，為介入拉美國家內政提供便利。很多拉美政要或學者，對此看得很清楚。古巴國家主席迪亞斯-卡內爾說，所謂“美洲之盾”峰會是“帶有新殖民主義性質”的會議。美國辦這個會的目的，就是讓一些拉美國家接受美國的軍事幹涉。巴西總統魯拉最近說，美國就是想“再次殖民我們”。這也是為什麼，美方高調吹噓的這個“具有歷史意義的會”，巴西、墨西哥、哥倫比亞三個拉美地區重要國家的領導人一致缺席。新華社的18秒視訊，揭示的是事實本質。目前，這個視訊在海外社交平台瀏覽量已經超過150萬，有厄瓜多媒體人評論說：“中國媒體對‘美洲之盾’的解讀很準確。”查德·沃爾夫曾在川普首個總統任期擔任美國國土安全部代理部長，現任美國全球戰略諮詢公司副董事長，並在川普陣營核心智庫——美國優先政策研究所主管國土安全、移民與西半球政策研究。但沃爾夫及他這個圈子裡的人發表的涉華文章，完全沒有嚴肅學術研究之風，充斥著“中國就是威脅、中國做啥都錯、要堅定遏制中國”的陳詞濫調。可見，沃爾夫之流以各種藉口鼓吹“中國威脅”論，連18秒的AI視訊也要東拉西扯一通。 (新華網)

全球AI雙榜第一！力壓GoogleVeo與Grok，Vidu Q3「參考生」之王歸來

【新智元導讀】Vidu Q3帶著「全家桶」重磅回歸，視覺、聽覺、場景能力全面進化。AI視訊的生產級交付時代，真的來了。這個月初，Google一紙公告，把Veo 3.1的視訊生成能力，免費開放給了所有Google帳號。可以說，這是AI視訊史上的一個分水嶺——曾經一條10秒視訊要燒掉數美金的「奢侈品」，正在被巨頭硬生生做成「水電煤」。但越是免費、越是普及，一個尷尬的問題就越藏不住：模型可以無限趨近「能用」，可它和「能交付」之間，依然隔著一整條生產線。榜單上的分數、demo裡的炫技、社交媒體上的爆款片段，全都換不來一個劇組、一支廣告團隊、一條電商內容流水線的穩定輸出。熱鬧歸熱鬧，能用歸能用，從來就是兩件事。而當大多數玩家還在卷免費、卷解析度、卷畫面時長時，一個被低估的中國玩家，悄悄把答案擺上了桌。今天，Vidu Q3帶著「參考生」重磅回歸。作為全球公認的「參考生鼻祖」，這一次，它直接把「參考生」揉進一整套全家桶——以Vidu Q3參考生模型為「核心底座」，Vidu SaaS（Vidu Agent、Vidu Claw）與 Vidu MaaS（Vidu AI 開放平台）全面接入。其中Vidu AI開放平台，可0門檻接入、價格僅為行業平均水平的1/3、切鏡自然合理、生成速度快。同時，它還支援提示詞調優、工作流適配及專項培訓服務，即便在高峰時段也能確保穩健輸出。以上三層加在一起，構成了一套完整的、可直接接入真實生產流水線的內容生產系統。至此，Vidu Q3已全面覆蓋文生、圖生、參考生三大領域，完成由單一模型向全場景視訊生成方案的跨越。正如Slogan所言，「為劇而生，萬物可參」，Vidu正在做一件其他玩家還顧不上做的事：把模型能力，焊死在真正的生產流程中。「參考生之王」回歸直接拍戲了要理解這件事的重要性，先把背景拎清楚。1月30日，Vidu Q3全球首發，在權威評測榜單AA上一騎絕塵，拿下了全球第一的成績。它一舉超越了Grok Imagine、Gen-4.5、GoogleVeo3.1等一眾領先模型。在全球首個參考生榜單，SuperClue榜單上，Vidu Q3斷層登頂，在多圖/單圖參考任務蟬聯雙榜第一。首次亮相，Vidu Q3便主打「為劇而生」，成為全球首個聲畫直出16秒的AI視訊模型。事實上，整個AI視訊行業的競爭焦點，正在悄悄發生一次根本性的位移。視訊大模型，正在從「生成畫面」邁向「生成內容」。比拚的重點也從單點能力，轉向兩件更本質的事——是否具備完整的敘事能力，以及，是否能進入真實場景的生產級交付。這兩件事，才是把AI視訊從「技術demo」推向「內容生產力」的真正分水嶺。Vidu Q3的出世，恰恰被視為整個行業轉變的階段性節點——從最早的「視訊生成」，到Q2的「演技生成」，再到Q3真正具備「劇集生產能力」的敘事單元級躍遷。每一步，Vidu都踩在了行業演化的關節上。而支撐這次躍遷的關鍵變數，正是Vidu一直握在手裡的那張王牌——參考生。在AI視訊走向生產級交付的這條路上，「參考生」的角色正被徹底改寫。它不再只是一個提升畫面一致性的工具能力，而正逐漸演變為一種可復用、可組合的內容生產範式。作為全球「參考生」首創者，名副其實的「參考生之王」，這一次，Q3直接把其從模型層推到了應用層。這種巨變，直接體現在了漫劇、短劇、廣告、影視劇等應用場景中的可用性和交付性。換句話說，Vidu讓AI視訊，真正具備了「劇」的表達能力，為劇而生。萬物可參，為「劇」而生，聲畫同出在視覺、聽覺和場景上， Vidu Q3系統性升級，招招致命。相較於上一代，Q3不再執著於枯燥的「生成質量指標」（FID/FVD）比拚，而是死磕一個核心目標：讓AI生成內容，真正具備「劇」的表達能力。要知道，所謂的「劇集感」，是由無數個符合直覺的微小細節堆砌而成的。Vidu Q3在視覺、聽覺與場景三個關鍵維度上，交出了一份令人「恐怖」的答卷。在視覺方面，Vidu Q3新增六大特效：粒子、流體、動力學、運鏡、轉場、光影，將其深度融入敘事語言，讓生成內容更接近「成片級表達」。五大沉浸式音效：環境、動態、氛圍、擬音、情緒，讓Q3賦予了AI視訊「聽覺上的敘事連續性」。至此，聲音不再是畫面的附屬，而是情緒的載體。最重要的是，Q3場景能力已進化為直接對齊工業流程的「內容單元」，大幅縮減從創意到成片的距離，覆蓋了短劇、漫劇、影視劇、廣告四大場景。在這些領域，Vidu 不僅實現了極速生成與高頻迭代，更通過極高的視覺穩定性，率先解決了AI創作中「角色一致性」的行業難題。這種從點到面的全場景滲透，標誌著Vidu已從技術驗證期跨入深度產業應用期，建立了不可踰越的落地領先優勢。為了驗證其真實戰力，我們拋棄了傳統的「跑分邏輯」，直接把Vidu Q3扔進更接近真實生產的內容場景裡——漫劇的高燃瞬間、短劇的情緒爆點、影視級的災難與懸疑調度，以及廣告的多元創意。高燃漫劇漫劇，是過去兩年AI內容工業化跑得最快的賽道之一。低成本、短周期、可批次生產，這些特性天然契合AI視訊的能力邊界。但也正因為漫劇對「量」的極致追求，它把AI視訊最致命的那塊短板暴露得淋漓盡致——一致性。一部大約60分鐘的漫劇，每分鐘三四十個鏡頭，每段AI生成的素材只有5–10秒。這就意味著，整部劇是由上千段片段硬拚而成。過去，AI模型最大的問題，是每一張圖之間彼此獨立：人物的臉換了一點、服裝紋樣飄了一點、道具位置跳了一幀，觀眾瞬間出戲。創作者在剪輯台前熬夜重抽素材的痛苦，幾乎是整個行業的共同記憶。一個能夠支援批次生產與快速迭代、同時把主角、場景、道具死死鎖住的模型，是漫劇工業化真正的分水嶺。丟給Vidu Q3一張紅圍巾校服少年的立繪，讓它生成一個「熱血少年覺醒變身」的短片。結果令人震撼，狂風的怒吼、電流的尖嘯、大地的碎裂聲在這一秒瘋狂交織、層層遞進，將情緒推向了最頂峰。最關鍵的突破點在於：複雜的特效變化下，男主形象始終如一。再比如，投喂給Q3一張古風女主的角色圖片、一張江南水鄉的場景圖、一套手繪的服化道參考。提示詞唯寫了一句，「@圖1穿著@圖2衣服，在@圖3江南水鄉行走」。可以看到，動漫女主的臉部特徵被死死鎖住，沒有出現任何畫風偏移或五官融化，服裝的紋理與褶皺也隨著行走步伐自然飄動。而且，背景還夾雜著微風、鳥叫聲、腳步聲生動的環境音效。如果說單人變身是基礎操作，那麼複雜的「雙人肢體纏鬥」則是檢驗AI模型能力的試金石。上傳兩個主角的圖片，在這段激烈的對峙戲中，Vidu Q3展現出了令人膽寒的技術統治力。面對拳腳相加、重擊倒地、連續翻滾等大動態物理互動，Vidu Q3將兩位主角的形象死死鎖住，徹底告別了傳統AI常見的「面部融化」與「服飾穿模」。不僅如此，它在音效與情感生成的顆粒度上達到了影院級水準：沉悶的肉搏聲、倒地後紊亂的喘息，甚至刀鋒逼近脖頸時那一聲微小且冰冷的顫音，都與畫面嚴絲合縫。這一段，可以直接剪進漫劇成片裡，幾乎不需要返工。真人短劇如果說漫劇拼的是「量」，那短劇拼的就是「戲」。中國短劇市場一年狂飆到幾百億規模，單集時長被壓到極致，敘事密度卻反向拉滿——每一句台詞、每一次對視、每一個停頓，都必須精準擊中觀眾的情緒點。大幅降低製作成本和周期，是短劇行業對AI視訊最迫切的呼喚；但前提是——AI必須先學會演對白戲，也就是說，短劇的生死線是「對話」。過去AI視訊在多人對話場景上最容易翻車：要麼兩個人同時張嘴像合唱團，要麼口型對不上台詞，要麼切鏡頭的瞬間人就變了。觀眾能容忍畫面糙一點，但對話一崩，戲就徹底散了。且看下面這段極其細膩的古風雙人對角戲，呈現了Vidu Q3令人驚嘆的「影視級演技」。Vidu Q3 不僅將兩人的骨相特徵與複雜的古裝妝造死死鎖住，更完美呈現了男主嘴角輕佻時那抹似有若無的笑意。這種告別了「AI僵硬感」的細膩神態捕捉，讓角色瞬間擁有了鮮活的靈魂。更令人稱絕的是隨後的雙人台詞交鋒，對話時口型的毫釐不差。再比如來一個現代劇，女強人和霸主之間的糾葛，在Vidu Q3的筆下呈現得淋漓盡致。廣告/電商對於廣告或電商而言，用AI的最大訴求可能就是提升效率──不止是素材版本多，創意要快，要快速試錯。素材生產效率，就是速度、就是搶先引爆熱點的優勢。而Vidu Q3不僅提升了素材生成效率，更重要的是人物、風格統一可控，商品不走樣，背景或人物任意選。比如，下列唇蜜的廣告，利用Vidu Q3參考生功能，可快速篩選不同的風格：只需替換參考模特，一鍵生成不同風格、聲情並茂的視訊，真一鍵出片！鏡頭逐漸推進唇部，模特用唇蜜塗抹在嘴唇上，特寫鏡頭展示唇蜜質感。廣告大片效果，多鏡頭展示。最後手持唇膏模特說說：This touch is more than just color.。去掉bgm，保留人聲再舉一個例子，老梗換新貨，更容易在網上爆紅。比如，威爾·史密斯吃義大利面，就是國外的經典梗之一，可謂歷久不衰。在Vidu Q3，用他的表情包+新的商品（比如漢堡），繼續利用參考生就能生成類似場景的梗圖。這效果看起來是真香！影視預演/內容創意影視劇是AI視訊最難啃的一塊骨頭，但也是價值天花板的最高場景。過去，一個劇本從文字到成片，中間要經歷概念設計、分鏡繪製、預演拍攝、特效合成——這背後，動輒是上千萬的預算，是以「月/年」為單位的製作周期。整個行業最渴望的，是一種能把劇本快速可視化、分鏡自動生成、創意驗證前置的能力，讓導演在燒錢之前，就先看到自己腦中的畫面。Vidu Q3沒有選擇繞路，直接正面正剛。它挑了三種最吃功力的片種：科幻、災難、懸疑。給到一段提示詞：根據參考機甲與未來都市場景，生成一段電影級科幻追逐戲。夜色中的賽博朋克城市高樓林立，霓虹燈閃爍，主角駕駛機甲在高架橋與樓宇之間高速穿梭，後方數架敵方飛行器緊追不捨。鏡頭先從城市遠景俯拍，再切入近距離追蹤，機甲急轉、噴射推進、擦過廣告螢幕與樓體邊緣，期間伴隨爆炸火光與碎片飛散。畫面要求有強烈速度感、空間縱深與電影感，參考主體外觀保持穩定，特效密集但清晰。這個生成的難點在於，俯拍切近景、遠景切追蹤、機甲高速運動、爆炸的碎片層次....每一個細節，都考驗著模型對「電影感」的理解。更狠的是音效，直接構成了一個立體聲場，給人一種身臨其境的壓迫感。再來看災難片，考核的是尺度與震撼，這是這類型大片的標準配方。Vidu Q3在生成效果中，處理了多層次的視覺要素：天空、水牆、慌亂的人群、建築物震顫，每一個要素配合著調度營造出一種末日緊迫感。而且，由遠及近的聲壓推進，更成為了這個視訊重頭戲。更令人想不到的是，一段廢棄醫院的長鏡頭，瞬間拉滿了那種脊背發涼的氛圍感。Vidu Q3不僅在空間推進中保持連貫，還在光影忽明忽暗中保留了真實性，角色表演也有一定的張力。音效更是克制到極致，燈管電流雜音、走廊回音、腳步聲、呼吸聲，把緊張感推向頂點。總言之，Vidu Q3在視覺、聽覺與場景三個關鍵維度上，將四大場景的應用推向了新的高光時刻。偉大的技術最終都將隱形於無形縱觀科技史，任何一項偉大的技術，其最終的宿命都是「隱形」。當電動機剛發明時，人們驚嘆於電流的魔力；但當大工業時代到來時，電動機隱身於工廠的流水線中，人們只看到源源不斷產出的精美商品。今天的AI視訊行業，正在經歷同樣的蛻變。Vidu Q3通過極盡複雜的底層演算法攻堅，通過從Q1到Q3的艱難跋涉，換來的，恰恰是創作者極其簡單的「為劇而生」。它終結了那個需要靠算運氣、抽盲盒才能得到一段好視訊的時代；它把AI視訊從獵奇者的「玩具箱」，搬到了專業創作者的「工作台」上。「萬物可參」，參考的不僅是現實世界的像素，更是人類無盡的想像力。當你在Vidu App中敲下第一行劇本，當Vidu Claw為你自動生成第一組分鏡，當Vidu Q3用它極具張力的音效和電影級的光影，把你腦海中那個原本只敢做夢的龐大宇宙完美呈現時，你會深刻地意識到：不要用做盲盒的邏輯，去奢望大工業時代的轟鳴。AI視訊的「前戲」已經結束，屬於創作者的、由新質生產力驅動的「大航海時代」，在Vidu Q3按下Enter的那一刻，正式拉開了帷幕。在這個充滿無限可能的時代，最好的故事，不再受制於資本的傲慢與工業的繁瑣。 (新智元)

Sora 死了，享年 6個月

曾經封神的 AI 視訊模型 Sora 就這麼沒了。前幾天，OpenAI 官方親自發文告別 Sora：應用關停、API 關停、視訊功能不再接入 ChatGPT。聽聞這一消息，有網友直接把 Elon Musk “墓碑梗圖”搬出來祭奠。評論區更是“人類迷惑行為大賞”：有人艾特創始人 Sam Altman 問“到底在幹嘛”。有人直接開噴“那我們憑什麼信你下一個產品”，還有人直接吐槽“死之前也不開源一下。”還有人很淡定：“沒事，還有別家能用。”老狐還記得，2024 年初 Sora 剛出來的時候，幾乎是“核爆級出圈”，堪稱“工業革命”。那會兒大家還在卷文生圖，它直接把“電影級視訊生成”甩到你臉上。雨水打在玻璃上的折射、人物走路的慣性、鏡頭推進的節奏，那種感覺不是“ AI 在畫圖”，是“ AI 在拍電影”。Sam Altman 一邊發 demo，一邊持續加碼預期。全網一度覺得這玩意兒，遲早要幹掉影視工業一部分。再後來，產品上線，會員專屬，邀請碼炒到飛起。再再後來，Sora 2 發佈，補齊音畫同步、角色對話、分鏡控制，甚至去年 9 月做了獨立 App。到這一步，其實路徑已經很明顯了，它不止想做工具，它是想做“ AI 時代的內容平台”。換句話說，它想成為 AI 版抖音。但問題也恰恰出在這。一開始大家玩得很開心，“把自己丟進電影裡”確實很爽。第一次：臥槽好牛；第二次：再試一個；第三次：……好像也就這樣。然後就沒有然後了。這不是技術問題，是典型的“ demo 型產品”困境，它證明了“能做”，但沒有建立“要一直用”的理由。新鮮感一過，使用者就散，留不住，也養不出習慣。相關資料顯示，Sora APP 的 30 天使用者留存率僅為 1%，60 天留存率直接歸零。與此同時，版權開始紛紛找上門。日本內容機構發函，好萊塢開始緊張。那怕後來 OpenAI 拉來了迪士尼，給了 IP 授權，開放漫威、皮克斯、星戰這些大殺器，看起來像是“終於要商業化了”。但是劇情出現反轉，到今年 1 月份，Sora 的下載量已暴跌 45%。再往後就更乾脆了：Sora 一關，迪士尼同步撤退，合作終止、投資取消，一起按下暫停鍵。你說這是產品問題嗎？不完全是。真正壓垮它的，其實是更現實的一件事：算力。做視訊太貴了，有測算說，Sora 一天燒的錢在千萬美元等級，一年下來就是幾十億美元的等級。一個使用者生成一段視訊，背後燒掉的資源，夠 ChatGPT 回答幾十次甚至更多問題。為了控製成本，OpenAI 不得不把免費使用者每日生成額度從 30 個削減到 6 個。這樣下來，進一步削弱了普通使用者的使用意願，加速了留存崩塌。同時，Google Gemini、Meta，以及國內的可靈、即夢等競品相繼推出視訊生成功能，使用者分流加速，Sora 的壓力驟增。走到這一步，問題就很直接了，那個賺錢就保留那一個。於是再看 OpenAI 最近的一系列動作，就完全順理成章：整合產品線做“超級應用”，All in 程式設計和生產力，把算力、團隊、資源都往能賺錢的地方集中。甚至有消息稱，為了給下一代模型騰算力，像 Sora 這種高消耗、低回報的業務，優先順序直接被往後排。說白了，這不是“做不出來”，是“沒必要做了”。聽起來冷血，但在 IPO 前，砍掉浪漫、留下現金流，是所有公司的必修課。回頭看，Sora 確實在 AI 視訊領域開了個好頭，只不過如今主角換了。字節跳動 Seedance 2.0 在卷真實世界模擬，水、布料、微表情，全在往“像真人拍的”逼近。快手 Kling 3.0 已經把商業閉環跑通，幾千萬創作者、幾億條視訊，直接悶聲賺大錢。這裡有個很關鍵的差異，Sora 是在“創造一個新場景”，而這些產品，是在“吃已有場景”。中國有短影片、電商、微短劇這套完整生態，模型一出來，立刻就有人用、有人反饋、有人變現。這是一個天然飛輪，而 Sora 當初做獨立App，本質是在從 0 開始搭生態。沒有創作者體系，沒有分發管道，沒有內容土壤。技術再強，也很難跑起來。可見，AI 視訊這件事，已經從“誰模型更強”，變成“誰生態更完整”。AI 行業，也已然從“炫技階段”，進入“算帳階段”。 (科技狐)